智能论文笔记

诸如Codebert之类的变压器网络已经为基准数据集中的代码克隆检测获得了出色的结果，因此可以假设已经解决了此任务。但是，代码克隆检测并不是一项琐碎的任务。尤其是语义代码克隆，要检测到具有挑战性。我们表明，Codebert的普遍性通过评估BigCloneBench的Java代码克隆的两个不同子集来降低。当我们评估与模型构建不同的代码段和功能ID时，我们会观察到F1分数的显着下降。

translated by 谷歌翻译

Cross-Domain Evaluation of a Deep Learning-Based Type Inference System

Bernd Gruner , Tim Sonnekalb , Thomas S. Heinze , Clemens-Alexander Brust

分类：机器学习

2022-08-19

可选类型的注释允许通过静态打字功能来丰富动态编程语言，例如更好的集成开发环境（IDE）支持，更精确的程序分析以及与类型相关的运行时错误的早期检测和预防。基于机器学习的类型推理有望自动执行此任务的有趣结果。但是，此类系统的实际用法取决于它们在跨不同领域概括的能力，因为它们通常在训练领域之外应用。在这项工作中，我们通过进行广泛的跨域实验来研究Type4py作为最先进的基于深度学习类型推理系统的代表性的概括能力。因此，我们解决了以下问题：数据集偏移，播音外词，未知类别和稀有类。为了执行此类实验，我们使用数据集nytypes4py和crossdomaintypes4py。我们在本文中介绍的后者。我们的数据集具有超过1,000,000个类型的注释，并可以使用来自两个域Web开发和科学计算的数据的数据的不同域中的类型推理系统进行跨域评估。通过我们的实验，我们检测到数据集中的变化，并具有长尾巴分布，并具有许多稀有和未知的数据类型，从而大大降低了基于深度学习的推理系统的性能。在这种情况下，我们测试了无监督的域适应方法和微调以克服问题。此外，我们研究了量量表的单词的影响。

translated by 谷歌翻译

用机器人手操纵物体是一项复杂的任务。不仅需要协调手指，而且机器人最终效应器的姿势也需要协调。使用人类的运动演示是指导机器人行为的直观和数据效率的方式。我们提出了一个具有自动实施例映射的模块化框架，以将记录的人体运动转移到机器人系统中。在这项工作中，我们使用运动捕获来记录人类运动。我们在八项具有挑战性的任务上评估了我们的方法，其中机器人手需要掌握和操纵可变形或小且脆弱的物体。我们测试了模拟和实际机器人中的轨迹子集，并且整体成功率是一致的。

translated by 谷歌翻译